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随 新 词 在 阅读 中 学 习 次 数 的 增 


阅读 时 的 眼 动 轨迹 。 结 果 显 示 : 


结果 表明 首 、 尾 词素 的 位 置 概率 信息 均 作 
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复学 习 新 词 时 首 、 尾 词素 位 置 概率 信息 作用 于 词 
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ein] ZR. 实验 二 操纵 尾 词 素 位 置 概率 高 低 ， 保 证 首 词素 相同 。 采 用 眼 


(1) 首 、 尾 词素 位 置 概率 信息 的 词 切 分 作用 
加 而 逐步 变 小 ， 表现 出 “熟悉 性 效应 ”。(2) 首 词素 位 置 概率 信 
娠 的 “熟悉 性 效应 ”表现 在 回 视 路 径 时 间 、 总 注视 次 数 两 个 相对 晚期 的 眼 动 指标 ,而 尾 词素 


立 置 概率 信息 的 “熟悉 性 效应 ” 则 从 凝视 时 间 开 始 , 到 回 视 路 径 时 间 , 再 持续 到 总 注视 时 间 。 
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司 加 工 中 具有 优势 的 观点 。 
和 随 词汇 学 习 ， 中 文 阅读 


词 是 阅读 的 基本 加 工 单位 (Bai et al., 2008; Li et al., 2022; Li & Pollatsek, 2020; Radach & 


Kennedy, 2004; Rayner, 1998, 2009)。 在 多 数 拼音 文字 书写 系统 中 《如 英语 、 德 语 等 )， 词 间 


线索 ， 词 切 分 过 程 显 得 更 为 复杂 ( 白 学 


空格 是 一 种 天 然 的 词 切 分 线索 ， 帮 助 读 者 从 视觉 」 
定位 (Clifton et al., 2016; Perea & Acha, 2009)。 由 于 中 文 阅 读 无 词 间 空格 之 类 的 视觉 词 切 分 
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新 词 时 ， 读 者 只 有 将 新 词 切 分 出 来 ， 才 可 能 通过 自 下 而 上 的 词汇 水 平 信息 


以 及 自 上 而 下 的 


语 境 水 平 信息 推断 新 词语 义 ， 逐 步 构建 新 词 表征 并 纳入 心理 词典 。 中 文 读者 在 阅读 中 依据 


何 种 线索 将 新 词 切 分 开 来 ? 对 该 问题 的 回答 有 助 于 到 
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制 ， 为 开发 高 效 词汇 学 习 方 式 提供 理论 支持 !。 


E 解 中 文 阅读 伴随 词汇 学 习 的 词 切 分 机 


词素 位 置 概率 信息 是 中 文 阅读 中 一 种 有 效 的 统计 学 词 切 分 线索 。 它 是 指 汉字 出 现在 多 字 
词 特定 位 置 的 概率 (如 词 首 、 词 中 、 词 尾 ) ( 连 坤 予 等 , 2021; Liang et aL, 2023)。 例 如 ， 在 


“各 ” 字 构成 的 29 个 双 字 词 中 如 “各 位 和 “各 自生 “各 种 ”等 )“ 
那么 ， 该 字 出 现在 词 首 的 概率 为 100%， 其 位 置 线索 完全 指向 词 首 ; 
双 字 词 中 (如 “成 员 are “演员 ”、 “ mL” ae), 只 有 


” 字 均 用 在 词 首 。 
AE " VA" SERERE 47 个 


其 余 46 个 词 “ 员 ” 均 用 在 
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味 着 词 n 的 结束 ， 词 nt] 的 开始 。 


具 了 一 定 的 词 切 分 信息 ， 例 如 , “学校 定 期 举办 | 各 种 沪 
出 现 意 味 着 前 一 词 np-1“ 举 办 ”的 结束 ， 当 前 词 na“ 各 种 ”的 开始 ;， 同样， 看 至 


在 “员工 ”一 词 中 “ 员 ” 字 用 在 词 首 ， 
尾 ， 则 该 字 的 位 置 线索 指向 词尾 。 位 于 词 内 特定 位 置 的 汉字 提 
舌 动 丰 富 同学 们 的 课余 生活 ”,“ 各 ”的 


| “ia” 也 意 


Liang 等 人 (2015, 2017) 通 过 两 项 实验 , 试图 回答 儿童 和 成 人 在 阅读 中 伴随 学 习 词 汇 时 是 


会 利用 词素 位 置 概 率 信 息 进行 词 切 分 。 构造 双 字 假 词 作为 新 词 , 同时 操纵 首 
首 词素 常用 在 词 首 、 尾 词素 常用 在 词尾 ， 


的 位 置 概率 高 低 ， 形 成 三 个 实验 条 件 : 一 致 条 件 ， 


词素 和 尾 词素 


提供 与 汉字 位 置 概率 一 致 的 切 分 信息 〈 如 “ 挑 尔 ”; 不 一 致 条 件 ， 首 词素 不 第 


词素 不 常用 在 词尾 (如 “ 子 左 ”， 提 供与 汉字 位 置 概率 不 一 致 的 切 分 信息 


s 平衡 条 件 ， 首 、 


在 词 首 、 尾 


尾 词素 用 在 词 首 或 词尾 的 概率 相当 , 均 在 50% 左 右 ( 如 “ 皮 合 ”)。 将 新 词 风 入 6 个 强 限制 性 


语 境 中 供 被 试 阅读 ， 用 以 


NS 


词 的 凝视 时 间 和 总 注视 时 间 显 著 长 于 一 致 条 件 和 平衡 条 件 , 表明 中 文 读者 在 阅读 中 可 以 利用 
词素 位 置 概率 信息 对 新 词 进行 切 分 。Liang 等 人 在 Li 等 
型 基本 假设 的 基础 上 , 尝试 解释 了 词素 位 置 概率 信 
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成 新 词 的 词汇 表征 。 结 果 发 现 ， 儿 童 和 成 人 在 不 一 致 条 件 下 对 新 


人 (2009) 关 于 中 文 词 切 分 和 词 识 别 模 


方式 。 在 读者 


^ 需要 说 明 的 是 ， 由 于 中 文 阅读 在 文本 呈现 方式 上 的 特殊 性 〈 词 间 无 清晰 的 视觉 线索 ， 例 如 空格 )， 词 切 分 和 词 识别 的 


关系 较为 复杂 。 目 前 的 主流 观点 《中文 阅读 眼 动 控制 模型 ， 简 称 CRM, Jil Li & Pollatsek, 2020; PX E-Z 阅读 者 模型 ， 简 称 


CEZR 模型 ， 见 Yuet al., 2021) 认为 ， 中 文 阅读 的 词 切 分 和 词 识别 是 统一 的 过 程 ， 完 成 词 切 分 则 意味 着 完成 词 识别 ， 反 过 来 ， 


Xr 


一 个 词 被 成 功 识别 则 意味 着 这 个 词 被 成 功 切 分 。 本 研究 将 沿用 


文中 用 词 切 分 来 表示 。 


主流 观点 ， 将 词 切 分 和 词 识 别 看 作 同 


一 个 过 程 。 为 方便 理解 ， 


知觉 广度 范 


围 内 所 有 汉字 被 平行 激活 时 , 汉字 的 位 置信 息 也 同时 被 激活 。 汉 字 处 于 词 内 


立 置 的 概率 越 高 ， 汉 字 处 了 


出 


mau! 


被 识别 。 反 之 ， 当 


已 激活 汉字 的 位 置信 息 和 词 


元 中 该 字 当 前 所 处 的 位 置 一 致 时 ， 


己 激 活 汉 字 的 位 置信 ， 


认 知 冲突 。 此 时 ,读者 需要 花费 额外 时 


则 解决 该 冲突 。 由 此 


位 置 的 激活 程度 也 越 高 。 当 激活 的 信息 传递 到 词 单元 时 ， 如 果 


则 容易 达到 阀 限 , 词 就 容易 


电 和 词 单元 中 该 字 当 前 所 处 的 位 置 不 一 致 时 ,会 造成 
EBT, Ah. A fa ME) 


JF 


词 加 工 与 识别 的 “ 字 - 组 - 词 ” 分 配 环节 Ccharacter-to-word assignment). A Liang 等 人 在 研 


完 中 证 实 了 词素 位 置 概率 信息 在 阅读 伴随 词汇 学 习 中 的 词 切 分 作用 。 然 而 , 研究 者 为 了 实现 


自 变 量 操 纵 的 最 大 化 ， 同 时 操纵 了 首 、 


尾 词素 的 位 置 概 率 信息 。 


素 、 尾 词素 的 位 置 概率 信息 ， 还 是 二 者 均 起 到 词 切 分 作用 。 


因此 ， 无 法 确定 究竟 是 首 词 


系列 研究 表明 ， 首 、 尾 词素 的 特征 
相关 实验 证 据 如 下 : (1) 首 词素 的 视觉 复杂 性 同时 作 /) 
条 性 仅 影 响 词 汇 识别 ， 
频 均 影响 词汇 识别 ， 但 尾 词 素 字 频 的 作 月 


征 的 激活 《如 语 境 多 样 性 、 语 义 透 明度 ) 发 生 时 程 较 早 ， 始 于 0~100ms; 


在 中 文 词汇 识别 中 的 作 / 


j 及 加 工 方式 并 不 完全 相同 。 


但 影响 显著 小 了 


首 词 素 (Ma & Li, 2015); (2) ff. 


于 词汇 识别 和 了 眼 跳 定位 ， 而 尾 词 素 的 


尾 词素 的 字 


受 首 词素 字 频 制约 (Yan et al., 2006); (3) 首 词素 特 


尾 词 素 特征 的 激活 


发 生 时 程 较 晚 ， 始 于 100~200ms (Tsang & Zou, 2022; Wang et al., 2017)。 由 此 推断 ， 首 词素 


于 中 文 阅读 的 视觉 词汇 加 工 从 才 


起 关键 作用 。 


词汇 识别 


在 拼 


在 双 字 词 识别 和 加 工 中 具有 一 定 优势 。 这 可 能 与 中 文 自身 的 文字 特征 以 及 阅读 方向 有 关 : 由 
至 右 进行 , 读者 对 首 词素 的 加 工 先 于 尾 词素 , 使 得 


首 词素 在 


章 文 字 阅 读 中 , 首 字母 组 合 的 主导 作 / 


j 还 受 限 于 单词 的 语音 形 


式 ， 即 语音 形式 是 由 构成 单词 


上 述 实验 证 据 ， 研 究 者 以 不 同 的 


| 所 有 字母 的 发 音 从 左 到 右 组 合 而 成 (Milledge etal., 2022). T 
式 将 首 、 尾 词素 的 不 同 地 位 纳入 词汇 识别 模型 。 例 如 ， 自 


我 组 织 词汇 习 得 与 识别 模型 (Self-organizing Lexical Acquisition and Recognition, 简称 SOLAR， 


KL Davis, 2001) 主 张 ， 字 母 位 置 的 激活 程度 从 词汇 左 侧 向 右 侧 逐步 递减 。 顺 序 编码 模型 


(Sequential Encoding Regulated by Inputs to Oscillations within Letter Units, 简称 SERIOL, 见 


Whitney, 2001) 也 主张 ， 字 母 的 兴奋 性 


输出 在 整 词 上 呈 梯 度 变 


逐步 减弱 o 基于 首 ^ 尾 词素 在 : 


文 双 字 词 识别 ! 


的 位 置 概 率 信 


息 在 阅读 伴随 词汇 学 习 ' 


的 作用 机 制 。 


的 不 同 作用 ， 有 必要 i 


， 变 化 方向 是 从 词 首 向 词 
步 明确 首 、 尾 词素 


毛 


近期 两 项 研究 在 


文 阅读 ! 


考察 了 首 、 


尾 词 素 位 置 概率 信息 


的 作用 ， 


但 结果 完全 对 立 。 


对 首 词素 位 置 概率 信息 的 作用 进行 考察 。 她 们 操纵 了 首 词素 的 


Liang 等 人 (2023) 在 实验 1 ! 


位 置 概率 信息 高 低 , 同时 保 i 


E 尾 词素 相同 , H. 


在 词 首 、 词 


必 的 概率 相当 (如 “湖水 /泉水 ”); 


实验 2 对 尾 词素 位 置 概率 信息 的 作用 进行 考察 , 操纵 尾 词 素 的 位 置 概率 信息 高 低 , 同时 保证 


首 词素 相同 ， 且 用 在 词 首 、 


词尾 的 概率 相当 (如 “包括 /包含 ”)。 结 果 发 现 ， 尾 词素 而 不 是 首 


词素 的 位 置 概率 信息 作 


j 于 中 文 阅 读 的 词 切 分 。 
尾 词素 位 置 概率 信息 在 高 频 词 阅读 中 的 作 


在 低频 词 阅读 中 的 作用 。 


在 每 个 实验 ! 


现 ， 在 高 频 词 加 工 ! 


不 是 尾 词 素 的 位 置 概率 信息 作用 于 中 文 阅读 的 词 切 分 。 两 项 研究 


方面 : 


第 一 ， 核 心 自 变量 


验 中 同时 操纵 首 、 尾 词素 的 位 置 概率 信息 ， 形 成 四 个 实验 条 件 : Pues Cu "HS. A 


首 、 尾 词素 位 置 概率 信息 均 不 起 


曹 海 波 等 人 (2023) 在 实验 2a 中 考察 了 首 、 
]， 在 实验 2b 中 考察 了 首 、 尾 词素 位 置 概率 信 
， 他 们 同时 操纵 首 、 尾 词素 的 位 置 概率 信息 。 结 果 发 
Hi 而 在 低频 词 加 工 中 ， 首 词素 而 


a 


Fl 
Pun 
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高 尾 低 (如 “享受 ”)、 


首 低 尾 高 (如 “ 


操纵 首 词 素 位 置 概率 高 低 的 同时 ， 保 证 尾 词素 相同 ， 且 不 提供 


结果 不 一 致 的 原因 有 如 下 两 


的 2X2 实验 设计 ， 在 一 个 实 


员 任 ”)、 首 低 尾 低 《 如 “想念 ”)。Liang 等 人 则 是 在 
词 切 分 信息 。 实验 1 包括 两 个 


实验 条 件 ， 首 高 尾 同 (如 “湖水 ”)， 首 低 尾 同 ( 如 “泉水 ”); 实验 2 包括 首 同 尾 高 Cu d 


括 ”)、 首 同 尾 低 (如 “包含 ”)。 由 此 站 


lr, B. FÉ 


影响 。 知 想 回 答 二 者 如 何 共 


的 词 切 分 作用 。 


言 恩 的 作用 方式 可 能 会 相互 


同 作用 于 阅读 伴随 词 


P 


能 受 词 频 所 调节 。 这 与 Yu 等 


中 所 主张 的 基于 字 、 词 熟悉 性 的 词 切 分 


断 接 下 来 哪 几 个 汉字 构成 一 个 词 ， 
于 词 内 特定 位 置 的 构 词 力 的 统计 学 信息 ,在 一 定 程度 上 可 能 会 
响 词 切 分 决策 。 例 如 ， 高 频 词 倾向 于 整 词 通达 ， 
低频 词 倾向 于 词素 通达 ， 此 时 ， 首 、 尾 词素 位 置 概率 信息 
氏 频 词 ， 更 依赖 于 自 下 而 


有 待 进一步 而 
的 位 置 概率 信息 如 何 作 


究 。 新 词 属于 极端 


第 二 ， 目 标 词 的 词 频 范围 不 同 。 曹 海 波 等 人 研究 中 的 高 频 词 范 
范围 为 157-237/ 百 万 。Liang 等 人 研究 中 目标 词 的 平均 词 频 为 38/ 百 万 ， 
使 用 的 高 、 低 频 词 之 间 ， 相 当 于 中 频 词 。 日 


[学 习 的 词 切 分 , 前 提 是 需要 理解 二 者 各 自 


. 围 在 46~56/ 百 万 ， 低 频 词 


H JC HE 、 尾 词素 位 置 概率 信 ， 


介 于 章 海 波 等 人 所 
息 的 作用 方式 可 


小 计算 机 于 
字 在 一 定 程度 均 有 激活 , 读者 会 依据 知觉 广度 内 未 被 识别 的 汉字 、 


j 于 阅读 伴随 词 ; 


人 (2021) 在 中 文 E-Z 阅读 者 模型 (Chinese E-Z Reader Model) 
体 来 说 ,在 阅读 知觉 广度 范围 内 的 


以 及 所 组 成 词 的 熟悉 性 判 


快速 进行 词 切 分 。 词 素 位 置 概率 信息 作为 一 种 基于 汉字 位 
多 啊 字 、 词 的 熟悉 性 ， 进 而 影 
首 、 尾 词素 位 置 概率 信息 均 不 起 作用 ;， 中、 
开始 起 作用 , 但 具体 的 起 作用 方式 
上 的 词素 表征 ， 那 么 ， 首 、 尾 词素 
[学 习 的 词 切 分 ?此 外 , 由 于 阅读 伴随 词汇 学 习 的 主 


要 特征 是 “累积 性 ”(Joseph et al., 2014; Joseph & Nation, 2018; Pagán & Nation, 2019)， 研 究 


者 常 将 新 词 嵌入 连续 几 个 不 同 语 境 中 ,帮助 读 者 逐步 形成 新 记 的 词汇 表征 。 在 此 过 程 中 ,新 
词 由 不 熟悉 逐步 向 熟悉 转变 ， 也 就 是 由 低频 词 逐步 向 中 频 词 、 高 频 词 转变 。 因 


此 ， 在 阅读 伴 


随 词汇 学 习 中 考察 首 、 尾 词素 位 置 概率 信息 的 作用 是 否 相同 , 将 有 助 于 从 词 频 连 续 变化 的 视 


角 对 上 述 问题 j 


进行 回答 。 
为 此 ， 本 研究 将 通过 两 项 实验 分 别 操纵 首 、 尾 词素 的 位 置 概率 信息 ， 首 先 回答 首 、 尾 词 
各 自在 阅读 伴随 词汇 学 习 词 切 分 中 的 贡献 ,实验 一 操纵 首 词素 位 置 概率 的 高 


素 位 置 概率 信息 


低 ， 同 时 保证 尾 词素 一 致 且 不 提供 词 切 分 信息 。 实 验 二 操纵 尾 词素 位 置 概率 的 高 低 ， 同 时 保 


(Coltheart et al., 


2022; Wang et al., 2017; Yan et al., 2006)， 我 们 预期 : 首 、 尾 词素 位 置 概率 信息 在 阅读 介 


汇 学 习 中 均 发 
纳入 模型 j 
位 置 概率 信息 


证 首 词 素 一 致 且 不 提供 


词 切 分 信息 。 基 于 新 词类 似 于 低频 词 ， 倾 向 于 词素 通达 的 加 工 方式 
2001)， 以 及 首 词素 在 双 字 词 识 别 中 的 加 工 优势 (Ma & Li, 2015; Tsang & Zou, 


Brig] 


挥 作用 ， 且 首 词素 位 置 概率 信息 的 作用 更 大 。 其 次 , 将 学 习 次 数 作 为 连续 变量 


行 分 析 ， 试 图 回答 在 新 词 由 不 认识 到 不 熟悉 再 到 逐步 熟悉 的 过 程 中 ,， 首 、 尾 词素 


作用 的 变化 方式 。 


们 预期 : 随 着 新 词 学习 次 数 的 增加 ， 首 、 尾 词素 位 置 概率 信息 的 词 切 分 作用 逐步 变 小 。 
2 实验 1 首 词素 位 置 概率 信息 在 阅读 伴随 词汇 学 习 中 的 作用 


2.1 实验 方法 
2.1.1 被 试 


64 ARH 


师范 大 学 在 校生 


参加 实验 。 所 有 被 试 母语 均 为 汉语 ， 视 力 或 钱 正 视力 


均 不 知晓 实验 目的 。 实 验 结束 后 给 予 被 试 一 定 报酬 。 
选择 参照 Liang 等 人 (2015, 2017) 的 研究 ， 效 应 量 水 平 为 0.48，a 水 平 为 
G*power 计算 结果 显示 , 55 名 被 试 为 最 小 样本 量 。 本 实验 被 试 数量 64 名 , 超过 最 小 样本 量 。 


2.1.2 实验 设计 


样本 量 的 


采用 单 因 
作为 连续 变量 


素 两 水 平 〈 首 词素 位 置 概率 : 


纳入 模型 ， 用 以 考察 首 词素 位 置 概率 信息 加 工 的 “熟悉 性 效应 ”。 
2.1.3 实验 材料 


基于 词 频 对 词素 位 置 概率 的 调节 作用 ( 曹 海 波 等 ,2023)， 我 


Aas 


E, 


0.01, 


、 低 ) 的 被 试 内 实验 设计 。 此 外 ， 将 学 习 次 数 


基于 SUBTLEX-CH 语料库 (Cai & Brysbaert, 2010)， 选 择 111 个 汉字 作为 构成 新 词 的 词 


素 。 其 中 ， 位 于 双 字 词 词 首 的 概率 在 85A E CU “AQ”, 50%AA Cu *WE"» 以 及 1596 


UF Cu E”) 的 汉字 均 为 37 个。 在 高 词素 位 置 概率 条 件 下 〈 简 称 “ 高 概率 ”)， 
首 概率 在 85% 以 上 的 汉字 和 50% 左 右 的 汉字 组 合 而 成 ， 如 “ 勾 席 ”; 


新 词 由 词 
在 低 词素 位 置 概率 条 件 
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下 《简称 “ 低 概 率 ”)， 新 词 由 词 首 概 率 在 15% 以 下 的 汉字 和 50% 左 右 的 汉字 组 合 而 成 ， 如 


"ERU. 最 终 构造 37 对 假 词 作为 新 词 。 APR 


名 大 学 生根 据 拼音 写 出 所 对 应 的 词语 。 


e 


FE 假 词 不 真实 存在 , 选取 不 参与 正式 实验 的 15 


最 后 选取 被 试 全 未 正确 写 出 的 14 对 词 作为 目标 词 。 


高 概率 条 件 下 首 词素 月 


zu 


在 双 字 词 词 首 的 平均 概率 为 93.24% (88.5%~100%); 低 概 率 条 


件 下 首 词素 用 在 双 字 词 词 首 的 平均 概率 为 8.84% (0~14%)。 两 个 实验 条 件 下 目标 词 的 尾 词 


素 相同 ， 且 在 词 首 、 


词尾 的 概率 均 在 50% 左 右 (48%~52%)。 此 外 ， 对 两 个 实验 条 件 下 目 


标 词 首 词素 的 笔画 数 (高 概率 条 件 : M=6.33, SD=1.91; 低 概 率 条 件 : M=7.07, SD=1.94) 


和 字 频 (高 概率 条 件 : M= 444 次 / 百 万 ，SD=728 次 / 百 万 ; 低 概 率 条 件 : M=261 次 / 百 万 ， 


SD=236 次 / 百 万 ) 进 


> 


字 频 均 无 显著 差异 , ts < 1. ps > 0.05. 
个 强 限制 性 语 境 的 句子 ， 将 其 描述 成 被 试 所 熟悉 的 某 一 语义 类 别 的 新 成 
员 《 例 如 ， 动 物 、 植 物 、 首 饰 等 )， 每 个 语义 类 别 设 有 两 个 新 成 员 ， 分 别 对 应 高 、 低 首 词素 


将 假 词 嵌入 6 


位 置 概率 条 件 。 本 实验 


同一 语义 类 别 中 出 ] 


每 个 句子 长 度 均 为 16 个 汉字 ， 将 目标 词 嵌 在 句子 中 间 ， 上 有 


了 匹配 。 配 对 样本 :检验 结果 显示 ， 两 个 实验 条 件 下 首 词素 的 笔画 数 和 


EG 14 个 语义 类 别 ，168 个 语 境 。 为 控制 尾 词素 相同 的 一 对 词 在 
岗 时 所 产生 的 实验 材料 间 的 干扰 , 创设 了 8 个 平衡 的 组 块 , 保证 被 试 在 不 
同 语义 类 别 下 阅读 尾 词素 相同 的 一 对 词 。 


| 目标 词 首 词素 和 尾 词 素 与 其 


相 邻 汉字 均 不 构成 双 字 词 ， 即 不 存在 词 切 分 歧义 的 可 能 性 。 分 别 选取 不 参与 正式 实验 的 10 
名 大 学 生 对 句子 的 通顺 性 和 难度 进行 5 点 等 级 评定 ， 其 中 “1” 
非常 简单 ,“5” 代 表 句 子 非常 通顺 或 句子 非常 难 。 句子 通顺 性 的 平均 值 为 3.93 (SD = 0.76)， 


>q 


度 的 平均 值 为 1.98 CSD = 0.94)， 表 明 句 子 通顺 且 容 易 理解 。 
在 每 个 新 词 嵌 入 的 6 个 语 境 里 ， 随 机 呈现 1-2 个 阅读 理解 类 


解 句 子 含 义 。 同 时 ,为 避免 阅读 更 


ERA 


代表 句子 非常 不 通顺 或 句子 


人 一 


Wiel, 考察 被 试 是 否 真 正 


出 现 目标 假 词 , 影响 词素 位 置 概率 的 加 工 进 程 ， 


所 有 阅读 理解 题 均 在 第 3 句 之 后 才 会 呈现 。 此 外 ， 为 考察 被 试 对 新 词语 义 类 别 的 掌握 程度 ， 


在 读 完 第 6 个 语 境 后 呈现 一 个 语义 类 别 选 择 题 ， 


包含 四 个 选项 : 两 个 选项 中 的 语义 类 别 来 


自 于 正式 实验 ， 另 外 两 个 是 填充 项 。 实 验 材料 及 实验 范式 见 表 1. 


表 1 实验 材料 及 实验 范式 


学 习 顺 序 句子 框架 
1 从 选材 到 制作 勾 谨 / 昱 夺 需要 经 过 多 重工 序 。 
2 多 次 地 切割 使 得 义 遍 / SEDES 
3 很 多 年 轻 人 认为 匀 遍 / 望 席 代表 浪漫 的 爱情 。 
4 很 多 人 在 购买 勺 遍 /里 所 之 前 要 量 手指 尺寸 。 
5 新 郎 和 新 娘 交 换 久 遍 / 望 席 戴 在 对 方 手指 上 。 
6 为 女 朋友 挑选 义 遍 / 畔 牛 需要 花费 很 多 心思 。 


语义 类 别 选 择 题 “请问 : 勾 席 / 望 席 属于 以 下 哪个 类 别 ? 
(a) 首饰 (b) 动物 Co) 杯 具 Cd) 防疫 用 品 
TE: 勾 席 为 高 首 词素 位 置 概 率 条 件 ， 望 席 为 低 首 词素 位 置 概率 条 件 


2.1.4 实验 仪器 

采用 EyeLink1000 眼 动 仪 ， 采 样 率 为 1000Hz， 屏 幕 分 辨 率 为 1024X768 像素 ， 刷 新 率 
为 120Hz。 被 试 与 屏幕 之 间 的 距离 为 70cm。 字 体 为 宋体 18 号 ， 每 个 汉字 大 小 为 25 X25 像 
素 ， 约 呈 0.80” 视 角 。 
2.1.5 实验 程序 

被 试 单独 施 测 。 首先， 进行 水 平 三 点 校准 ,平均 误差 小 于 0.25”。 校准 成 功 后， 呈现 指 
导语 ， 在 被 试 理解 实验 要 求 后 进入 练习 试 次 。 随 后 进入 正式 实验 。 一 屏 呈 现 一 个 句子 ， 阅 读 
完毕 后 ， 按 “空格 键 ” 翻 页 。 回 答 阅 读 理解 题目 时 ， 使 用 鼠标 “ 左 键 ” 选 择 屏幕 中 相应 的 正 
AER. E 6 个 句子 全 部 阅读 完毕 后 ， 被 试 需 根据 6 个 语 境 的 描述 判断 所 学 新 词 的 语义 类 
1， 同样 使 用 鼠标 “ 左 键 ” 选 择 正 确 答案 。 整 个 实验 持续 30 分 钟 左右 ， 为 缓解 被 试 疲劳 ， 
10 分 钟 左右 让 被 试 休息 1-2 分 钟 。 
2.1.6 数据 分 析 

参照 前 人 研究 (Liang et al., 2015, 2017, 2023)， 选 取 首 次 注视 时 间 、 凝 视 时 间 等 反映 词汇 
识别 早期 的 眼 动 指标 以 及 回 视 路 径 时 间 、 总 注视 时 间 、 回 视 出 比率 、 总 注视 次 数 等 反映 词汇 


识别 晚期 的 眼 动 指标 作为 因 变 量 。 基 于 RR Development Core Team, 2016) 语 言 环 境 下 的 线 


zu 


uu 


H 


性 混合 模型 (liner mixed model, LMM)、 广 义 线性 混合 模型 (generalized mixed-effects models, 
GLMMs) 和 Ime4 数据 包 (Bates et al., 2023) 进 行 数据 分 析 。 对 时 间 类 眼 动 指标 进行 log 转换 。 
将 首 词素 位 置 概率 作为 固定 因素 ,学习 次 数 作为 连续 变量 , 被 试 、 项 目 作 为 随机 效应 纳入 模 
型 。 采 用 最 大 随机 效应 结构 模型 ， 若 无 法 拟 合 ， 则 采用 逐渐 递减 原则 ， 直 至 模型 拟 合成 功 。 


2.2 实验 结果 


根据 以 下 标准 删除 数据 ( 白 学 军 等 ,2019; JEJE 等 ,2019; Liang et al., 2015, 2017): (DD 
和 主 视点 持续 时 间 小 于 80ms 或 大 于 1200ms; (2) 眼 动 追踪 信号 丢失 ; (3) 单个 句子 注视 点 少 


7 


ny 


于 3 个 ; (4) 3 个 标准 差 之 外 。 删 除数 据 占 总 数据 的 0.3%。 

阅读 理解 选择 题 的 平均 正确 率 为 97.77%; 语义 类 别 选择 题 的 平均 正确 率 为 95.15%。 表 
明 被 试 在 实验 过 程 中 认真 阅读 了 实验 语句 ， 并 习 得 了 新 词 的 语义 类 别 。 

高 、 低 概率 实验 条 件 下 对 目标 新 词 的 注视 情况 见 图 1， 模 型 结果 分 析 汇 总 见 表 2。 


320 440 900 
m 一 -高 概率 ~*~ 低 概率 áo | 一 -高 概率 e- 低 概率 一 -高 概率 e- 低 概率 
= 280 B 360 E 700 
m E E 
= 260 € 320 2 600 
È 240 Ag 280 A 500 
炎 220 240 400 
200 200 300 
1 2 3 A 5 6 1 2 3 4 5 6 
学 习 次 数 学 习 次 数 
800 100 3.5 
全 HER e- [ENDE HER “|*- [ENDE 20 一 高 概率 e- [ENDE 
E gs; 9 ` * 
MH 500 = 
E. 400 ES “0 
回 3o0 20 
200 
3 2 3 4 5 6 I 2 3 A 5 6 l 2 3 4 5 6 
学 习 次 数 学 习 次 数 学 习 次 数 
图 1 高 、 低 首 词素 位 置 概率 条 件 下 新 词 的 注视 情况 
表 2 不 同 词素 位 置 概率 实验 条 件 下 的 模型 分 析 汇 总 结果 
变量 b SE tz 9594CI 
截 距 5.49 0.01 457.88 [5.46, 5.51] 
ee 首 词素 位 置 概率 -0.01 0.02 -0.62 [-0.04, 0.02] 
首次 注视 时 间 Mu 
学 习 次 数 —0.03 0.005 -521 [-0.04, —0.02] 
首 词素 位 置 概率 义学 习 次 数 0.0002 0.004 0.05 [-0.01, 0.01] 
截 距 5.67 0.03 177.65 [5.61, 5.73] 
uu 首 词素 位 置 概率 -0.04 0.02 -2.11 [-0.08, -0.003] 
凝视 时 间 
学 习 次 数 —0.05 0.01 -8.39 [-0.06, -0.04] 
首 词素 位 置 概率 义学 习 次 数 0.01 0.01 1.01 [-0.01, 0.02] 
截 距 6.20 0.05 137.37 [6.12, 6.29] 
"mE 首 词素 位 置 概率 -0.10 0.02 -432 [-0.15, -0.06] 
总 注视 时 间 en 
学 习 次 数 —0.11 0.01 —12.87 [-0.12, -0.09] 
首 词素 位 置 概率 义学 习 次 数 0.01 0.01 1.37 [-0.004, 0.02] 
截 距 6.02 0.04 136.97 [5.94, 6.11] 
| 首 词素 位 置 概 率 —0.10 0.03 -3.53 [-0.15, -0.04] 
AREKIN [d j 
学 习 次 数 —0.09 0.01 —10.35 [-0.11, —0.07] 
首 词素 位 置 概率 义学 习 次 数 0.01 0.01 2.04 [0.001, 0.03] 
截 距 -1.13 0.14 -7.79 [-1.41, -0.84] 
可 视 出 比率 首 词素 位 置 概率 -0.21 0.13 -1.61 [-0.46, 0.05] 
学 习 次 数 -0.17 0.03 5.99 [-0.22, -0.11] 


首 词素 位 置 概率 X 学 习 次 数 
is 

首 词素 位 置 概率 

学 习 次 数 


首 词素 位 置 概率 义学 习 次 数 


在 所 有 了 眼 动 指标 分 析 中 ， 学 习 次 数 的 主 效应 均 显 


0.02 


2.32 


一 0.33 


—0.20 


0.05 


0.03 


0.09 


0.05 


0.02 


0.01 


随 词汇 学 习 的 “累积 性 ”特点 。 


新 词 学 习 次 数 的 增加 ， 被 试 对 新 词 的 注视 时 间 逐 步 缩短 ， 


0.69 
26.55 
—6.63 

—12:31 


3.97 


著 (|tz]s > 5.21,ps < 0.001)， 随 着 


回 视 比率 逐步 降低 ， 


[-0.04, 0.09] 
[2.15, 2.49] 
[-0.42, -0.23] 
[-0.24, -0.17] 
[0.02, 0.07] 


重复 了 阅读 伴 


在 首次 注视 时 间 分 析 中 ， 首 词素 位 置 概率 的 主 效应 ， 以 及 与 学 习 次 数 的 交互 作用 均 不 


显著 (tls < 0.62, ps > 0.05)， 表 明 在 新 词 加 工 的 早期 阶段 ， 被 试 对 首 词素 的 位 置 概率 信 


息 不 敏感 。 


在 凝视 时 间 分 析 中 ， 首 词素 位 置 概率 效应 显著 (|#=2.11,p=0.03)， 高 概率 条 件 下 目标 


词 的 凝视 时 间 显 著 短 于 低 概率 条 件 , 表明 在 新 词 加 


的 位 置 概率 信息 ; 首 词 素 位 置 概率 与 学 习 次 数 的 交互 作用 不 显著 (1= 101, p > 0.05)， 表 
明 首 词素 位 置 概率 信息 稳定 地 作用 于 新 词 学 习 的 全 程 。 
在 回 视 出 比率 分 析 中 ， 首 词素 位 置 概率 的 主 效应 ， 以 及 与 学 习 次 数 的 交互 作用 均 不 显 


[的 相对 早期 阶段 ,读者 开始 加 工 首 词 素 


著 (lzls < 1.6l,ps > 0.05)。 但 在 回 视 路 径 时 间 分 析 中 ， 首 词素 位 置 概率 的 主 效应 ， 以 及 


与 学 习 次 数 的 交互 作用 均 显著 (uis > 2.04,ps < 0.05， 交 互 作用 见 


图 2a)， 被 试 在 高 、 低 
概率 条 件 下 对 目标 词 前 语 境 回 视 时 间 的 差异 随 新 词 在 阅读 中 学 习 次 数 的 增加 逐步 减 小 ,该 结 


目标 词 前 语 境 的 注视 时 间 。 


果 表 明 , 新 词 首 词素 位 置 概率 的 高 低 不 会 影响 读者 对 目标 词 前 语 境 的 


回 视 比 率 , 但 是 会 影响 


在 总 注视 时 间 的 分 析 中 ， 首 词素 位 置 概率 以 及 学 习 次 数 的 主 效应 均 显 著 (lils > 4.32, 


ps< 0.001)， 但 二 者 的 交互 作用 不 显著 (1= 1.37,p > 0.05)。 在 总 注视 次 数 分 析 中 ， 首 词 


素 位 置 概率 的 主 效应 ， 以 及 与 学 习 次 数 的 交互 作 | 


TERI 
差异 随 新 词 在 阅读 中 学 习 次 数 的 增加 逐步 减 小 。 


cc 


j 均 显著 (ltls > 3.97, ps < 0.001, ZE. 
图 2b)， 随 着 新 词 学 习 次 数 的 增加 ， 被 试 在 高 、 低 概率 条 件 下 对 目标 词 总 注视 次 数 的 


首 词素 位 置 概率 * 学 习 次 数 首 词素 位 置 概率 * 学 习 次 数 


.25 3. 
$ —— 高 概率 M — 高 概率 
- = = 低 概率 = = 低 概率 
€ 6.00 2.5 
Hi ES 
E x 
E 575 = 2.0 
= z 
= 
S 550 1.5 

5.25 1.0 

i 2 3 5 6 I 2 3 4 5 «6 
学 习 次 数 学 习 次 数 
图 2a 交互 作用 《〈 回 视 路 径 时 间 ) 4] 2b 交互 作用 (总 注视 次 数 ) 


2.3 讨论 


实验 1 通过 操纵 新 词 首 词素 位 置 概率 的 高 低 ， 考 察 了 中 文 读者 在 阅读 伴随 词汇 学 习 中 


是 否 利用 该 信息 


进行 词 切 分 。 本 实验 的 第 一 个 重要 发 现 是 , 在 反映 词汇 加 工 相对 晚期 的 眼 动 
指标 中 《如 凝视 时 间 、 回 视 路 径 时 间 、 总 注视 时 间 以 及 总 注视 次 数 )， 发 现 了 显著 的 首 词素 


位 置 概率 效应 , 即 新 词 首 词素 常用 在 词 首 时 , 其 加 工时 间 显 著 短 于 新 词 首 词 素 不 常用 在 词 首 


时 。 该 结果 与 本 研究 的 第 一 个 预期 相符 合 , 表明 首 词素 位 置 概率 信息 作用 于 阅读 伴随 词汇 学 
习 的 词 切 分 。 该 发 现 与 Liag 等 人 (2023) 的 研究 结论 不 一 致 ， 但 与 曹 海 波 等 人 (2023) 在 低频 
词 中 关于 首 词素 位 置 概率 的 作用 结论 一 致 .基于 上 述 两 项 研究 以 及 本 研究 中 对 目标 词 词 频 的 
操纵 差异 ， 可 以 推断 ， 高 频 词 ( 曹 海 波 等 , 2023) 和 中 频 词 (Liang et al., 2023) 加 工 中 没有 出 现 


我 们 将 同时 结合 


A 


首 词素 位 置 概率 效应 ， 而 在 低频 词 和 新 词 加 工 中 却 存在 首 词 素 位 置 概率 效应 。 在 总 讨论 中 ， 


首 、 尾 词素 位 置 概率 信息 的 结果 发 现 ,详细 阐释 词 频 调 节 词 素 位置 概 率 信息 
加 工 的 内 在 机 制 。 
本 实验 的 第 二 个 发 现 则 是 , 在 回 视 路 径 时 间 和 总 注视 次 数 两 个 晚期 眼 动 指标 上 , 首 词素 


位 置 概率 和 学 习 次 数 的 交互 作用 显著 。 随 着 新 词 在 阅读 中 学 习 次 数 的 增加 , 首 词素 位 置 概率 
效应 逐步 减 小 ,最 后 消失 。 该 结果 与 本 研究 的 第 二 个 假设 一 致 ， 表明 首 词素 位 置 概率 信息 的 
词 切 分 作用 表现 出 “熟悉 性 效应 ”或 “学 习 效应 ”。 结 合 阅读 伴随 词汇 学 习 的 累积 性 特点 ， 


首 词素 位 置 概率 信息 加 


[的 “熟悉 性 效应 ”实则 与 新 词 词汇 表征 逐步 构建 ， 由 极端 低频 词 逐 


步 向 高 频 词 转变 的 过 程 相 关 。 进 一 步 解释 为 ， 当 新 词 在 阅读 中 首次 出 现 之 前 , 读者 头脑 中 没 


有 关于 新 词 表征 的 任何 信息 ， 


是 一 个 完全 意义 上 的 极端 低频 词 ; 当 新 词 首次 在 阅读 中 出 现时 ， 


读者 不 得 不 依据 语 境 以 及 新 词 首 词素 的 位 置 概率 信息 进行 词 切 分 和 词 识 别 , 在 此 过 程 中 初步 


构建 新 词 的 形 、 音 、 义 表征 ; 


随 着 新 词 在 阅读 中 出 现 次 数 的 增多 ， 新 词 表征 构建 的 越 来 越 完 


善 , 读者 可 以 在 一 定 程度 上 依据 已 存储 的 新 词 表征 自 上 而 下 地 词 切 分 ,此 时 将 不 再 依赖 于 自 
下 而 上 的 首 词素 位 置 概率 信息 ， 由 此 表现 出 新 词 首 词素 位 置 概率 效应 的 逐步 消失 。 
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3 实验 2 尾 词素 位 置 概率 信息 在 阅读 伴随 词汇 学 习 中 的 作用 


3.1 实验 方法 


3.1.1 被 试 


男 选 64 名 天 津 师范 大 学 在 校生 作为 被 试 。 被 试 选择 标准 同 实 验 1. 


3.1.2 实验 设计 


采用 单 因 素 


一 


两 水 平 


为 连续 变量 纳入 模型 进行 分 析 ， 


3.1.3 实验 材料 


3x. HP, fied 
DR Can "m" 
下 《简称 “高 概率 ”)， 新 词 的 
率 条 件 下 (简称 “ 低 概 率 ”)， Bria 


EN 


尾 词 素 位 置 概率 : 高 、 低 ) 被 试 内 实验 设计 。 此 外 ， 将 学 习 次 数 作 


] 以 考察 尾 词素 位 置 概率 信息 加 工 的 “熟悉 性 效应 ”。 


基于 SUBTLEX-CH 语料库 (Cai & Brysbaert, 2010)， 选 择 132 个 汉字 作为 构成 新 词 的 词 


双 字 词 词尾 的 概率 在 85% 以 上 (如 “ 坛 ”)、50% 左 右 ( 如 “ 朴 ”) 以 及 15% 


尾 词 


A A ial 


件 下 ,新 词 的 首 词素 为 同一 汉字 ， 用 在 词 首 


后 选取 被 试 全 


含 验 结果 显示 ， 两 个 实验 条 从 


的 尾 词 


) 的 汉字 均 为 44 个 。 目 标 词 的 构造 方法 同 实验 1， 在 高 尾 词素 
EERTE 85% 以 上 的 汉字 构成 : 在 低 尾 词素 位 置 概 
素 由 


立 置 概率 条 件 


词尾 概率 在 15% 以 下 的 汉字 构成 。 两 个 实验 条 


、 词 尾 的 概率 均 在 50% 左 右 。 为 保证 本 实验 所 使 
的 假 词 均 为 “ 假 词 ”， 选取 不 参与 正式 实验 的 15 名 大 学 生根 据 拼音 写 出 所 对 应 的 词语 。 最 
未 正确 写 出 首尾 词素 的 15 对 词 作为 目标 词 。 
两 个 实验 条 件 下 目标 词 的 操纵 和 匹配 方式 同 实验 1， 描 述 


统计 见 表 3 所 示 。 配 对 样本 t 


表 3 实验 材料 匹配 结果 


F 下 尾 词素 的 笔画 数 和 字 频 均 无 显著 差异 。 


尾 词素 位 置 类 目标 词 举 尾 词 素平 均 词素 位 置 概 首 词素 平均 词素 位 置 概 尾 词 素平 均 笔画 FÉ UR] ROTE IAE 
型 例 率 率 数 频 

高 概率 条 件 T 93.5% (86965-10096) 50% (4896-5294) 7.13 (2.58) 183 (394) 

低 概率 条 件 Thr 8.4% (0~13%) 50% (48%~52%) 7.07 (2.32) 254 (486) 


ik: 字 频 的 和 


站 位 是 次 / 百 万 。 


为 排除 实验 句子 框架 


子 框架 。 实 验 材料 及 实验 范式 见 表 4 所 示 。 
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es 不 同 对 两 个 实验 结果 带 来 的 影响 ， 实 验 2 采用 与 实验 1 相同 的 名 


表 4 实验 材料 及 实验 范式 


学 习 顺 序 句子 框架 
1 从 选材 到 制作 相去 / 朴 趾 需要 经 过 多 重工 序 。 
2 多 次 地 切割 使 得 朴 坛 / 朴 吊 更 加 的 光彩 厅 
3 很 多 年 轻 人 认为 补 去 / 朴 吊 代表 浪漫 的 爱情 。 
4 (RE MIA Eos 付 员 之 前 要 量 手 指 尺 寸 。 
5 新 郎 和 新 娘 交 换 补 二， 补品 戴 在 对 方 手指 上 。 
6 为 女 朋友 挑选 朴 坛 /让 中 需要 花费 很 多 心思 。 
语义 类 别 选择 题 请问: 朴 坛 / 朴 吊 属 于 以 下 哪个 类 别 ? 


(a) 首饰 (b) 动物 Co) 杯 具 (d) 防疫 用 品 
注 :， 朴 坛 为 高 尾 词素 位 置 概率 条 件 ， 朴 吊 为 低 尾 词素 位 置 概率 条 件 


3.1.4 实验 仪器 和 实验 程序 


同 实验 1。 
3.2 结果 

眼 动 数据 删除 标准 同 实验 1， 删 除数 据 占 总 数据 的 0.2%。 眼 动 指 标 选 择 和 数据 分 析 方 
法 同 实验 1。 阅 读 理解 选择 题 的 平均 正确 率 为 97.40%; 语义 类 别 选择 题 的 平均 正确 率 为 
94.79%。 表 明 被 试 在 实验 过 程 中 均 认 真 阅读 了 实验 语句 ， 并 习 得 了 新 词 的 语义 类 别 。 高 、 
低 概率 实验 条 件 下 对 目标 新 词 的 注视 情况 见 图 3， 模型 结果 分 析 汇 总 见 表 5。 


320 460 900 
300 一 -高 概率 tO 低 概 率 k 一 -高 概率 “~je- 低 概率 < 一 -高 概 率 ”“e- 低 概率 
加 S 8 
£ [^3 g 从 
f= 280 E, 380 m 700 Y 
ES MN E un 
gs 2 B 30 S 9 
T 240 = ao JH sob 
M WC c 
WI 220 260 400 
200 220 300 
1 2 3 4 5 6 1 2 3 4 5 6 
学 习 次 数 学 习 次 数 
00 100 35 
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图 3 高 、 低 尾 词素 位 置 概率 条 件 下 新 词 的 注视 情况 
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表 5 不 同 词素 位 置 概率 实验 条 件 下 的 模型 分 析 汇总 结果 


变量 b SE tz 9594CI 
截 距 5.54 0.02 299.10 [5.50, 5.57] 
mo 尾 词素 位 置 概率 -0.02 0.02 -0.97 [-0.05, 0.02] 
首次 注视 时 间 ae 
学 习 次 数 —0.03 0.003 —8.99 [-0.03, —0.02] 
尾 词 素 位 置 概 率 X 学习 次 数 0.005 0.004 0.12 [-0.01, 0.01] 
截 距 5.78 0.03 229.84 [5.73, 5.83] 
尾 词素 位 置 概率 —0.08 0.02 -3.90 [-0.12, 0.04] 
凝视 时 间 
学 习 次 数 -0.06 0.005 -13.19 [-0.07, -0.05] 
尾 词素 位 置 概率 X 学 习 次 数 0.01 0.01 2.14 [0.001, 0.02] 
截 距 6.30 0.05 127.52 [6.20, 6.40] 
尾 词素 位 置 概率 -0.12 0.02 5.46 [-0.17, -0.08] 
总 注视 时 间 
学 习 次 数 -0.12 0.01 —12.37 [-0.14, -0.10] 
尾 词 素 位 置 概率 X 学 习 次 数 0.02 0.01 3.28 [0.01, 0.03] 
截 距 6.12 0.04 159.41 [6.05, 6.20] 
尾 词素 位 置 概率 -0.12 0.03 =422 [-0.18, -0.06] 
可 视 路 径 时 间 
学 习 次 数 -0.10 0.01 -12.72 [-0.12, -0.08] 
尾 词 素 位 置 概率 X 学 习 次 数 0.02 0.01 2.18 [0.002, 0.03] 
截 距 -121 0.14 -8.60 [-1.49, -0.93] 
尾 词素 位 置 概率 -0.10 0.13 -0.75 [-0.36, 0.16] 
可 视 出 比 
学 习 次 数 -0.17 0.03 —6.42 [-0.22, -0.12] 
尾 词 素 位 置 概率 义学 习 次 数 —0.002 0.03 —0.07 [-0.07, 0.06] 
截 距 2.44 0.08 28.75 [2.27, 2.60] 
尾 词素 位 置 概率 -0.31 0.05 一 6.46 [-0.41, -0.22] 
总 注视 次 数 
学 习 次 数 -0.23 0.02 —14.08 [-0.27, -0.20] 
尾 词 素 位 置 概率 X 学 习 次 数 0.06 0.01 5.28 [0.04, 0.08] 


在 所 有 了 眼 动 指标 分 析 ， 


新 词 学 习 次 数 的 增 


， 学 习 次 数 的 主 效应 均 显 著 (ts > 6.42,ps < 0.001)， 随 着 
回 视 比 率 逐 步 降低 ， 再 次 为 阅读 人 


加 ,被 试 对 新 词 的 注视 时 


随 词 汇 学 习 的 “累积 性 ”提供 实验 证 据 。 
司 素 位 置 概率 的 主 效应 ， 以 及 与 学 习 次 数 的 交互 作用 均 不 显 
# (ts < 0.97, ps > 0.05)， 表 明 在 新 词 加 工 的 早期 阶段 ， 读 者 对 尾 词素 的 位 置 概率 信息 


在 首次 注视 时 间 分 析 : 


不 敏感 。 


» Fel 


在 凝视 时 间 、 总 注视 时 间 、 总 注视 次 数 


次 数 的 交互 作 
高 尾 词素 位 置 概率 条 们 


间 逐 步 缩 短 ， 


应 随 着 新 词 学 习 次 数 的 增加 逐步 减 小 ， 最 后 消失 。 
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HW 


， 尾 词素 位 置 概率 的 主 效应 ， 以 及 与 学 习 
[IB (lis > 2.14, ps < 0.05)。 相 比 于 低 尾 词素 位 置 概率 条 件 ， 被 试 在 
F 下 对 新 词 的 凝视 时 间 和 总 注视 时 间 显著 缩短 ， 总 注视 次 数 显著 减少 ， 


表现 出 显著 的 尾 词 素 位 置 概率 效应 。 进 一 步 的 交互 作用 分 析 发 现 〈 见 图 4a、4b、4c)， 该 效 


在 回 视 出 比率 分 析 中 , 尾 词 素 位置 概 率 的 主 效应 ， 以 及 与 学 习 次 数 的 交互 作用 均 不 显著 
(|zls < 0.75,ps > 0.05)。 但 在 回 视 路 径 时 间 分 析 中 ， 尾 词素 位 置 概率 的 主 效应 ， 以 及 与 
学 习 次 数 的 交互 作用 均 显 著 Ces > 2.18,ps < 0.05， 交 互 作用 见 图 4d)。 被 试 在 高 尾 词素 
位 置 概率 条 件 下 对 新 词 的 回 视 路 径 时 间 显 著 短 于 低 尾 词素 位 置 概率 条 件 , 表现 出 显著 的 尾 词 
素 位 置 概率 效应 。 进 一 步 的 交互 作用 分 析 发 现 ， 该 效应 随 着 新 词 学 习 次 数 的 增加 逐步 减 小 ， 
最 后 消失 。 上 述 两 个 与 回 视 相关 的 眼 动 指标 分 析 表 明 ， 随 着 新 词 在 阅读 中 学 习 次 数 的 增加 ， 
新 词尾 词素 位 置 概率 不 会 影响 读者 对 目标 词 前 语 境 的 回 视 比率 , 但 是 会 影响 对 目标 词 前 语 境 


的 注视 时 间 。 


尾 词素 位 置 概率 * 学 习 次 数 尾 词素 位 置 概率 * 学 习 次 数 
5 
= — 高 概率 s —— 高 概率 
== 低 概率 $ == 低 概率 
^A 5.8 > 6.25 I 
E » 
d - 
LI 5.6 = 6.00 
X 54 3 5.75 
52 5.50 
1 2 3 4 5 6 1 2 3 4 5 6 
学 习 次 数 学 习 次 数 
图 4a 交互 作用 《凝视 时 间 ) 4b 交互 作用 (总 注视 时 间 ) 
尾 词素 位 置 概率 * 学 习 次 数 尾 词素 位 置 概率 * 学 习 次 数 
3.0 一 一 高 概率 c; — 高 概率 
== 低 概率 ^ == 低 概率 
2.5 # 63 
om 
z i 
= 2.0 E 60 
= E: 
1.5 S 57 
1.0 54 
1 2 3 4 5 6 1 2 3 4 5 6 
学 习 次 数 学 习 次 数 
图 4c 交互 作用 《总 注视 次 数 ) 图 4d 交互 作用 《〈 回 视 路 径 时 间 ) 
3.3 讨论 


实验 2 通过 操纵 新 词尾 词素 位 置 概率 的 高 低 ， 考 察 了 读者 在 阅读 伴随 词汇 学 习 中 是 否 
利用 尾 词素 的 位 置 概率 信息 进行 词 切 分 。 首 先 ， 与 实验 1 类 似 , 在 反映 词汇 加 工 相 对 晚期 的 
眼 动 指标 中 《〈 如 凝视 时 间 、 回 视 路 径 时 间 、 总 注视 时 间 以 及 总 注视 次 数 )， 发 现 了 显著 的 尾 
词素 位 置 概率 效应 ， 即 新 词尾 词素 常用 在 词尾 时 ， 其 加 工时 间 显 著 短 于 尾 词素 不 常用 在 词尾 
时 。 该 发 现 验证 了 本 研究 的 第 一 个 假设 ， 且 与 Yen 等 人 (2012) 和 Liang 等 人 (2023) 的 研究 结 


论 一 致 ， 表 明 尾 词素 位 置 概率 信息 作用 于 阅读 伴随 词汇 学 习 的 词 切 分 。 


14 


本 实验 的 第 二 个 发 现 则 是 ,在 凝视 时 间 、 总 洽 


相对 晚期 眼 动 指标 中 , 尾 词 素 位 置 概率 和 学 习 次 数 的 交互 作 | 
习 次 数 的 增加 ， 
表明 尾 词 素 位 置 概率 信息 的 词 切 分 作用 同 李 


加 了 
表明 首 、 


尾 词 素 位 置 概率 信 


ALIVE 


视 时 间 、 回 视 路 径 时 间 和 总 注视 次 数 四 个 
] 均 显著 。 随 着 新 词 在 阅读 中 学 
尾 词 素 位 置 概率 效应 逐步 减 小 ,最 后 消失 。 该 发 现 符合 本 研究 的 第 二 个 假设 ， 


HT POR 


表现 出 “熟悉 性 效应 ”或 “学 习 效应 ” 
对 比 实验 1 和 实验 2， 除 了 首次 注视 时 间 这 个 反映 词汇 早期 加 工 的 眼 动 指 标 外 ， 在 词汇 
[相对 晚期 的 眼 动 指标 〈 回 视 出 比率 除外 ) 中 均 发 现 了 首 词素 和 尾 词素 的 位 置 概率 效应 ， 


#F 随 词汇 学 习 的 词 切 分 ， 目 


加 工时 程 类 似 。 


这 与 泰文 阅读 中 的 研究 发 现 一 致 (Kasisopa et al., 2013, 2016)。 泰 文 作为 一 种 无 空格 拼音 文字 


语言 , 没有 明显 的 视觉 词 切 分 线索 。 对 了 


尾 词素 位 置 概率 信息 作为 一 种 统计 学 词 切 分 线索 , 促进 词 ; 


词 内 最 但 


Ely Be 


泰语 读者 而 言 , TCE AR ELE 
别 , 并 引导 读者 将 眼 跳 定 位 到 


[ 识 


7N 


需要 注意 的 是 , 词素 位 置 概率 信息 的 作 


差异 。 在 实验 1 


数 两 个 词汇 加 


， 首 词素 位 置 概率 与 学 习 次 数 的 交互 作 
晚期 的 眼 动 指标 , 并 未 表现 在 凝视 时 间 这 个 反映 词汇 加 工 相 对 早期 的 眼 动 指 


j 随 学 习 次 数 的 变化 则 表现 日 
j 表 现在 回 视 路 径 时 间 和 总 举 


[rx 
LT 


a, AJA) 


j 首 、 


、 尾 词素 之 间 的 


FE 视 次 


标 。 上述 结 果 表明 在 词汇 加 工 的 相对 早期 阶段 ,， 首 词素 位 置 概率 信息 作用 贯穿 于 新 词 学 习 的 


15878 


小 ， 最 后 消失 ， 表 现 出 相应 的 “熟悉 性 
j 则 从 凝视 时 间 这 个 反映 词 ; 
径 时 间 、 总 注视 时 间 和 总 注视 次 数 三 个 词汇 加 工 晚 期 的 上 


息 的 词 切 分 作 上 月 


数 的 交互 作 


Bt, 尾 词素 位 置 概 率 信 


» 


效应 ”。 


加 


全 程 ( 从 第 1 次 阅读 至 第 6 次 阅读 )， 并 未 表现 出 首 词素 位 置 概率 信息 的 “熟悉 性 效应 ”而 


在 词汇 加 工 的 相对 晚期 阶段 , 首 词素 位 置 概率 信息 的 作 新 词 学 习 次 数 的 递增 而 逐步 减 


在 实验 2 中 ， 尾 词素 位 置 概率 信息 与 学 习 次 


相对 早期 的 眼 动 指标 开始 , 一 直 持续 到 回 


视 路 


就 开始 随 着 


新 词 学 习 次 数 的 增多 而 逐 


尾 词素 位 置 概率 信息 的 “熟悉 性 效应 ”。 从 二 者 的 交互 作 
,读者 利用 新 词 首 、 


在 前 几 次 新 词 学 习 ， 
词 表征 的 逐步 构建 与 贡 


推断 ， 相 比 于 尾 词素 ， 首 词素 位 置 概率 信 


更 稳定 。 


该 发 现 为 首 词 素 在 双 字 词 中 的 加 了 了 


动 指标 。 表明 在 词 》 


加 工 的 早期 阶 
步 消 失 , 表现 出 


图 可 以 发 现 ， 


息 在 阅读 伴随 词 


& Zou, 2022; Wang et al., 2017; Yan et al., 2006). 


4 总 讨论 


本 研究 通过 两 个 : 
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熟悉 性 效应 实则 
尾 词素 位 置 概率 信息 进行 词 切 分 和 词 识别 。 随 着 新 
固 ， 在 后 几 次 的 新 词 学 习 中 ， 该 信息 则 不 再 起 到 词 切 分 的 作用 。 由 此 
[学 习 中 的 词 切 分 作用 时 程 更 长 ， 
[优势 提供 了 新 的 实验 证 据 (Ma & Li, 2015; Tsang 


Ei 
AE 


“ 行 实验 分 别 操纵 首 、 尾 词素 位 置 概率 高 低 ， 考 察 了 首 、 尾 词素 位 置 概 


率 信息 如 何 
位 置 概率 信 


IEHKI 
小 ， 最 后 消失 。(3) 相 比 于 


E 


IF B EEG Rp 7L 21 


Nia] Wa. Ah 


BLtH 


ELEME FIT FOSC EFE BG T] 7 


“熟悉 性 效应 ” 随 着 新 词 在 阅读 ， 


学 习 次 数 的 增 


究 有 如 下 三 个 发 现 ; (1) 首 、 
-学习 的 词 切 分 。(2) 首 、 尾 词素 位 置 概率 信息 的 词 


加 ， 


作 


读 眼 动 控制 


尾 词 素 ， 首 词素 的 位 置 


模型 ， 


行 讨论 。 


4. 首 、 尾 词素 位 置 概率 信息 词 切 分 作用 的 不 同 


本 研究 
息 的 词 切 分 


等 眼 动 指标 


率 信 


但 与 前 几 次 阅读 相 比 ， 该 信 


首 、 尾 词素 位 置 概率 信 


发 现 ， 首 ^ 
作 


中 均 表 现 出 首 


TALE 


尾 词 素 位 置 概率 信息 均 作 


] 于 阅读 


华 随 词 汇 学 习 的 词 切 分 ， 


j 随 学 习 次 数 的 变化 表现 出 首 、 
j， 在 凝视 时 间 、 回 


尾 词素 之 间 


、 尾 词素 位 置 概率 效应 ; 在 新 词 
县 继续 起 到 词 切 分 的 作用 


《在 凝视 时 间 和 总 注视 时 间 j 
奶 的 词 切 分 作用 有 减 小 的 趋势 ， 表现 为 在 


次 数 两 个 眼 动 指标 上 首 词 素 位 置 概率 信息 和 学 习 次 数 的 交互 


次 学 习 | 


， 尾 词素 位 置 概率 信息 的 词 切 分 作 


位 置 概率 信息 在 阅读 伴随 词汇 学 习 中 的 作 


j 则 完全 消失 。j 


上 表现 出 


尾 词 素 


其 词 切 分 作用 逐步 变 
是 率 信息 在 阅读 伴随 词汇 学 习 中 的 词 切 分 
] 时 程 更 长 ,更 稳定 。 结 合 中 文 阅读 在 文本 呈现 方式 上 的 特殊 性 ， 以 及 当前 主流 的 中 文 阅 
对 上 述 发 现 3 


旦 是 该 信 


回 视 路 径 时 间 


方式 受 新 词 学 习 阶 段 的 调节 。 


的 差异 : 在 新 词 的 前 几 次 学 习 中 ， 
视 路 径 时 间 、 总 注视 时 间 和 总 注视 次 数 
的 后 几 次 学 习 中 ， 首 词素 的 位 置 概 


首 词 素 位 置 概率 效应 )， 


、 总 注视 


EH. HEZ TF, 在 新 词 的 后 几 


上 述 研究 结果 表明 ， 首 、 尾 词素 


依据 复合 词 的 混合 通达 表征 模型 (Caramazza etal., 1988)， 在 新 词 学 习 的 早期 阶段 ， 新 词 


的 加 工 方式 


类 似 于 低频 词 〈 在 心理 词典 中 倾向 于 以 词素 形式 储存 )， 


较 大 ， 使 得 首 、 


尾 词素 


ui 


ERMETE 
中 的 作用 则 
位 置 概率 信 


综合 以 


词 


回 有 的 位 置 概 率 信 ， 
后 期 阶段 ， 新 词 的 加 工 方式 开始 逐步 向 中 频 词 ， 
)， 整 词 表征 在 词汇 识别 
越 来 越 小 ， 此 时 ， 读 者 对 词素 水 3 
息 的 词 切 分 作用 逐步 减 小 。 


识 


只 别 受 词素 表征 影 


相应 地 ， 词 素 表 征 在 词 ? 


往 文献 , 在 阅读 


WEY 得 一 个 新 词 , 


V 


首 、 


He 


电 得 到 激活 ， 帮 助词 切 分 和 词 识别 ;在 新 词 学 习 的 
至 高 频 词 转变 〈 在 心理 词典 中 倾向 于 以 整 
所 起 的 作用 越 来 越 大 ， 
的 位 置 概率 信息 敏感 性 降低 ， 使 得 


识别 
尾 词素 


少 需要 在 阅读 中 出 现 12~15 次 (Joseph et 


al., 2014; Liang et al., 2021; Nation et al., 2007; Tamura et al., 2017)。 本 研究 中 的 新 词 在 阅读 中 


仅 出 现 6 X 


， 距 离 


个 低 


成 完整 的 新 词 表 征 尚 远 ， 未 能 达 至 


频 词 。 此 时 ， 首 词素 的 词 切 分 作 


4A 


完结 


素 位 置 概率 


A. 


fà 


F 


息 的 词 切 分 作 上 月 


依然 存在 ， 


| 高 频 词 的 表征 方式 ， 充 
j 尾 词素 的 词 切 分 作 ) 
在 新 词 学 习 的 后 几 次 ,， 首 词素 位 置 概率 信息 的 词 切 分 作用 依然 存在 ， 而 尾 词 
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日 


IWR. Bi 


Hi. 表明 随 着 新 词 学 习 的 深入 , 尾 词素 的 词 切 分 作用 首先 消 


失 ， 然 后 再 是 首 词 素 词 切 分 作用 的 消失 。 由 此 推断 ， 在 中 文 阅读 伴随 词汇 学 习 过 程 中 ， 相 比 
于 尾 词素 , 首 词素 位 置 概率 信息 所 起 的 词 切 分 作用 时 程 更 长 。 当 读者 继续 在 阅读 中 学 习 同一 
新 词 时 ， 随 着 新 词 表征 的 巩固 与 完善 ， 新 词 的 加 工 方式 越 来 越 接近 高 频 词 。 当 整 词 表征 占 主 
导 时 , 将 重复 曹 海 波 等 人 (2023) 的 研究 成 果 , 首 、 尾 词素 位 置 概率 信息 的 词 切 分 作用 均 消失 。 

由 此 推断 , 在 中 文 词汇 习 得 的 全 程 中 , 词素 位 置 概率 信息 的 词 切 分 作用 随 着 学 习 的 深入 
发 生变 化 ， 见 图 S 所 示 : 在 新 词 学 习 的 早期 ， 首 、 尾 词素 位 置 概率 信息 均 起 作用 ， 随 着 新 记 
学 习 的 深入 ， 尾 词素 位 置 概率 信息 的 作用 首先 递减 ， 再 是 首 词素 位 置 概率 信息 作用 的 递减 
在 新 词 学 习 的 后 期 ， 首 、 尾 词素 位 置 概率 信息 的 词 切 分 作用 均 消失 。 既 然 在 新 词 学 习 的 早期 
阶段 ， 首 、 尾 词素 位 置 概率 信息 均 起 到 词 切 分 的 作用 ， 那 么 ， 后 续 研究 有 必要 明确 二 者 的 共 
同 作用 方式 。 此 外 ， 后 续 研究 也 有 必要 明确 首 、 尾 词素 位 置 概率 的 词 切 分 作用 消失 的 时 间 与 
新 词 表征 构建 程度 之 间 的 关系 , 即 当 新 词 学 习 到 什么 程度 时 读者 就 不 再 依据 首 、 尾 词素 的 位 
置 概率 信息 进行 词 切 分 与 词 识别 。 


j 


新 记 学 习 的 早期 | 新 记 学 习 的 中 期 | K 


为 女 朋 友 挑选 到 磺 需 要 花费 很 多 心思 。 
| 


首 词素 | [ o -— 


尾 词素 | [= 


图 5 词素 位 置 概率 信息 词 切 分 作用 随 学 习 的 深入 发 生变 化 的 模式 


注 ， 蓝 色 阴 影 大 小 表示 首 、 尾 词素 位 置 概率 词 切 分 作用 大 小 

首 、 尾 词素 位 置 概率 信息 在 词 切 分 作用 中 的 差异 , 一 方面 为 中 文 双 字 词 (特别 是 低频 词 ) 
识别 中 首 词素 具有 加 工 优势 提 供 了 新 的 实验 证 据 ( 曹 海 波 等 , 2023; Ma & Li, 2015; Milledge 
et al., 2022; Tsang & Zou, 2022; Wang et al., 2017; Yan et al., 2006); 一 方面 也 证 实 了 基于 拼音 
文字 阅读 提出 的 自我 组 织 词汇 习 得 与 识别 模型 以 及 顺序 编码 模型 所 提出 的 核心 假设 的 正确 
性 一 一 词汇 中 字母 激活 程度 由 词 首 向 词尾 逐步 递减 (Davis,2001; Whitney, 2001)。 虽 然 中 文 的 
词 长 较 拼 音 文字 语言 《如 英语 、 芬 兰 语 等 ) 变异 程度 较 小 ， 以 双 字 词 为 主 ， 系 列 实验 证 据 依 
然 在 中 文 阅读 中 肯定 了 首 词素 的 加 工 优势 。 这 可 能 是 由 于 :(1) 中 文 文本 从 左 到 右 的 书写 和 
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阅读 加 工 方式 使 得 首 词素 更 为 重要 ; (2) 从 左 到 右 的 视觉 处 理 方式 使 得 首 词 素 的 信息 更 易 获 


得 ; (3) 只 有 从 左 至 右 依次 加 工 首 、 尾 词素 , 才能 获得 词汇 的 语音 信息 。 基于 上 述 实验 证 据 ， 


模型 的 解释 力 。 


有 必要 在 中 文 阅读 眼 动 控 制 模型 的 发 展 与 完善 中 , 将 首 词素 的 加 工 优势 纳入 模型 , 用 以 增强 


42 首 、 尾 词素 位 置 概率 信息 加 工 对 于 理解 中 文 阅读 词 切 分 机 制 的 启示 


由 于 中 文 阅 
近 的 中 文 阅读 眼 动 控 人 


同时 就 意味 着 词 ; 
研究 团队 的 发 现 ,解释 了 为 何 尾 词素 ,而 不 是 首 词素 的 位 置 概率 信息 在 中 文 阅 读 中 起 到 词 切 


读 无 词 问 空 格 之 类 的 视觉 信息 作为 词 切 分 线索 ,其 词 切 分 机 制 相对 复杂 。 新 
判 模 型 主张 ， 中文 的 词 切 分 和 词 识别 是 同一 过 程 , 当前 词 被 切 分 出 来 的 


[已 经 被 识别 (Li & Pollatsek, 2020). Liang 等 人 (2023) 基 于 该 观点 以 及 她 们 


分 作用 。 当 读者 3 


阅读 一 句 话 时 (如 “快乐 阅读 是 我 们 最 美的 教育 退 求 ”), 句 首 第 一 个 词 
的 左边 界 是 确定 的 ， 读 者 只 要 依据 尾 词素 (“ 乐 ”) 的 位 置 概率 信息 判断 首 词 的 结尾 在 哪里 ， 
就 能 完成 首 词 的 切 分 与 识别 。 由 于 中 文 阅读 中 相 邻 两 个 词 共 享 一 个 词 边界 ， 上 一 词 的 词尾 


(“ 乐 ”) 与 下 一 词 的 词 首 (“ 阅 ”) 共享 一 个 边界 ， 即 上 一 词 CORR”) 的 右边 界 就 是 下 一 词 


(“阅读 ”) 的 左边 界 ， 因 
首位 置 同时 被 识别 。 WA, 基于 认 知 加 工 的 经 济 性 原则 ,读者 无 需 再 利用 首 词素 的 位 置 概率 


此 ， 当 读者 完成 前 一 个 词 的 切 分 与 识别 时 ， 就 意味 着 下 一 个 词 的 词 


言 息 进行 词 首 的 


于 切 分 , 而 只 需 利 用 尾 词素 的 位 置 概率 信息 判断 词尾 在 哪里 即 可 完成 当前 词 


识别 。 同 时 ， 下 一 词 的 词 首位 置 已 经 被 识别 ， 依 此 类 推 ， 完 成 句子 阅读 与 理解 。 


显然 ，Liang 等 人 (2023) 目 前 的 观点 无 法 解释 本 研究 的 发 现 。 本 研究 所 发 现 的 首 、 尾 词 


素 位 置 概率 信息 的 加 了 


位 置 概率 信息 是 否 


[方式 受 词 频 所 调节 ,对 于 发 展 与 修正 该 理论 解释 有 如 下 启示 : 首 词素 


与 否 的 检验 过 程 有 关 。i 


,在 一 定 程度 上 依赖 于 词汇 的 加 工 难度 , 这 可 能 与 当前 词 切 分 正确 


步 解释 为 ， 虽 然 词 首位 置 在 识别 上 一 词 时 就 已 确定 ， 但 是 由 于 高 


频 词 的 加 工 相 对 容易 ,读者 可 以 在 副 中 央 四 处 利用 下 一 词 更 多 的 预 视 信 息 , 进行 首次 词 切 分 ， 
使 得 首次 切 分 正确 率 相对 较 高 。 此 时 , 读者 就 不 再 需要 激活 首 词素 的 位 置 概率 信息 完成 词 切 
分 的 检查 过 程 ; 相 比 之 下 ， 由 于 低频 词 或 新 词 的 加 工 相 对 较 难 ， 虽然 词 首位 置 在 识别 上 一 词 


时 也 已 确定 , 但 由 于 读者 在 进行 首次 切 分 时 所 能 利用 的 下 一 词 的 预 视 信息 相对 较 少 ,导致 首 


次 切 分 的 正确 率 相 对 较 低 。 在 完成 当前 词 切 分 正确 与 否 的 检验 过 程 时 , 读者 可 能 会 再 次 激活 


首 词 素 的 位 置 概率 信息 。 


基于 上 述 讨 论 , 有 必要 在 后 续 研 究 中 进一步 考察 首 词素 位 置 概率 信 


县 作用 于 


Bm 


文 阅读 的 发 4 
词 切 分 作用 的 权衡 。 


条件, 在 此 基础 上 理解 中 文 阅读 文本 呈现 方式 与 首 词素 位 置 概率 信 
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首 、 尾 词素 位 置 概率 信息 的 加 工 方式 受 词 频 所 调节 这 一 研究 结论 ， 为 Yu 等 人 (2021) 所 
主张 的 基于 字 词 熟悉 性 的 词 切 分 算法 提供 了 直接 的 实验 证 据 。 如 前 所 述 ,词素 位 置 概率 从 本 
质 上 是 基于 汉字 位 于 词 内 特定 位 置 的 构 词 力 的 统计 信息 , 可 能 在 一 定 程度 上 影响 词汇 的 熟悉 
性 计算 。 如 果 一 个 汉字 位 于 词 首 所 构成 的 双 字 词 数量 较 多 ， 且 使 用 频率 较 高 ， 则 意味 着 该 汉 
字 的 熟悉 性 相对 较 高 ， 切 分 起 来 相对 容易 ， 反 之， 会 增加 词 切 分 难度 。 后 续 研 究 有 必要 明确 
词素 位 置 概率 信息 与 字 、 词 熟悉 性 之 间 的 关系 ， 并 尝试 将 其 纳入 模型 ,解释 中 文 阅读 中 基于 
字 词 熟悉 性 计算 的 词 切 分 机 种 


Li 


= 
o 


5 结论 


本 研究 条 件 下 得 出 如 下 结论 : C 首 、 尾 词素 位 置 概率 信息 均 作 用 于 阅读 伴随 词汇 学 
习 的 词 切 分 。(2) 相 比 于 尾 词素 ， 首 词素 的 位 置 概率 信息 在 阅读 伴随 词汇 学 习 中 的 词 切 分 
作用 时 程 更 长 ， 更 稳定 。 
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Abstract 

In natural unspaced Chinese reading, there are no salient visual word segmentation cues (like 
word spaces) to demark where words begin or end, yet Chinese skilled readers process a comparable 
amount of text content as efficiently as English readers, processing roughly 400 characters (equal 
to 260 words) per minute (see Liversedge et al., 2016). This raises the question of how Chinese 
readers engage in such word segmentation processing efficiently and effectively. Liang et al (2015, 
2017) have shown that the positional probability information associated with a character, might 
offer a cue to the likely positions of word boundaries during Chinese incidental word learning. Given 
that they simultaneously manipulated the positional probabilities of both word initial and word final 
characters to make their manipulations maximally effective, it is unclear whether the initial, the 
final, or both constituent characters’ positional probabilities contribute to the word segmentation and 
word identification effects during incidental word learning in Chinese reading. For this reason, in 
the present study, two parallel experiments were designed to directly investigate whether word 
initial, or word ending characters are more or less important for word segmentation word learning 
in Chinese reading. 

Two-character pseudowords were constructed as novel words. Each novel word was embedded 
into six high-constraint contexts for readers to establish novel lexical representation. In Experiment 
1, we examined how word’s initial character positional probability influenced word segmentation 
and word identification during Chinese word learning. The initial character’s positional probability 
of target words was manipulated as being either high or low, and the final character was kept 
identical across the two conditions. In Experiment 2, an analogous manipulation was made for the 
final character of the target word to check whether the final character positional probability of two- 
character words can be used as word segmentation cue. We also included “Exposure” as a 
continuous variable into the model to further examine how the process of initial and final character 
positional probabilities changed with exposure. 

In both experiments, the participants spent shorter reading times and made fewer fixations on 
targets that comprised initial and final characters with high relative to low positional probabilities, 
suggesting that the positional probability of both the initial and final character of a word influences 
segmentation commitments in novel word learning in Chinese reading. Furthermore, both the effect 
of initial and final character positional probabilities of novel words decreased with exposure, 
showing the typical familiarity effect. To be somewhat different, the familiarity effect associated 
with the initial character had a slower time course relative to final character. This finding suggests 


that the role of word’s initial character positional probability is of more importance than that of final 
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character’s, supporting the concurrent standpoint that word beginning constituents might be more 
influential than word final constituents during two-character word identification in Chinese reading. 
Based on the findings above, the time course of the process of initial and final character 
positional probabilities of novel words is argued and summarized as follows. During the early stage 
of word learning, both the statistical properties of word’s initial and final character positional 
probabilities are processed as segmentation cue. As lexical familiarity increases, the extent to such 
segmentation roles decreases, which initially begins with final character, and then occurs with initial 
character. Later, both the roles of initial and final character positional probabilities disappear with 
the establishment of a more-integral representation of novel words. 
Keywords character positional probability, word segmentation, incidental word learning, Chinese 


reading 
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